М
А
Ш
И
Н
Н
О
Е
О
Б
У
Ч
Е
Н
И
Е
С
П
О
Д
К
Р
Е
П
Л
Е
Н
И
Е
М
Ме
то
д
основанный на
вообр
ажении
АКТУ
АЛЬНОСТЬ
МАШИННОЕ
ОБУЧЕНИЕ
С ПО
ДКРЕПЛЕНИЕМ
(
ОСНОВНЫ
Е ПОНЯТИЯ)
Семейства алгоритмов г
луб
ок
ого обучен
ия с
по
д
крепление
м
Основа машинного обучен
ия с
по
д
крепление
м
МЕТ
О
Д
ОБУЧЕНИЯ
I2A
АРХИТЕКТУР
А
I2A
СТРУКТУР
А
МО
ДЕЛИ МИР
А
ПЕРВОНА
ЧАЛЬНАЯ
МО
ДЕЛЬ
О
Т
A2C
ОБУЧЕНИЕ
ENVIRONME
NT
MO
D
EL
ЭК
СПЕРИМЕ
НТ
ПРИМЕР
BO
XING
–
A
T
ARI
GAMES
СПА
СИБО
ЗА ВНИМ
АНИЕ